JSAI2026 アプリ操作ログからのユーザ属性推定手法の検討
ユーザ属性の推定手法
時系列行動ログの蓄積、分析
アプリの利用目的外になりがちで同意を得づらい
アプリ操作ログの課題
離散的で疎な特徴を持つ
UI構造に依存するログが多くてノイズになる
提案手法
操作ログの意味ベクトル化
疎なものをone-hotとして扱うとダメ
Embeddingモデルで意味ベクトル(密ベクトル)を作る
似たような操作が近似される
操作から興味がある行動をあぶり出しやすくなる daiiz.icon
対照学習による特徴量抽出
全ユーザー共通のログに関するノイズの除去
属性推定モデルの構築
実験
4パターン
LLMの意味ベクトル化、Transformer + 対照学習
One-hot、Transformer + 多ラベル回帰
データ
ライフスタイル系アプリのユーザー 1500名ほど
結果
ユーザー識別精度高い
属性推定(趣味嗜好の推定)
提案手法が良い結果だったが低い
質問
単一アプリに実装されている機能によってこの手法に限界がある?
アプリ操作に現れない趣味嗜好は推定できない。この傾向が強いので分析が必要。
感想 daiiz.icon
やっぱりEmbeddingは楽しい
#聴講メモ